查看原文
其他

法律检索入门三步法 | iCourt

王平 iCourt法秀 2020-11-07

Alpha

打通案例、法规和司法观点库

一键生成可视化智能检索报告

申请体验Alpha,扫描二维码联系诺诺多


作者:王平

微信:seanzwdx1021

单位:元创智成律师团队

编者按

大数据时代,法律检索已经成为律师日常工作中必不可少的部分。但如何才能将法律术语变成计算机语言?如何才能准确、快速、全面地检索到所需信息?且看本文作者教你三步轻松入门法律检索。


法律检索是我们将抽象的法律术语,糅合成计算机听得懂的语言,利用计算机的方式找到我们需要的法律数据,最后通过计算机整合出我们想要的内容的过程。


这个过程中,我们需要解决三个问题:


1、明白计算机是如何存储和展现数据的,这是掌握法律检索的前提;

2、将法律术语高度概括,转化成计算机“听得懂”的语言;

3、指令计算机查找我们需要的内容并展现。

 

在法秀平台上,有很多优秀的文章阐述了后两个问题。本文则首先就第一个问题进行了深入浅出的解释,之后再涉及问题二和问题三,帮助大家浅显易懂地理解法律检索并掌握相关方法。

 

   计算机如何储存和展现数据

律师是一个爱阅读的集体。对每个人而言,随着藏书数量的不同,对于书籍(数据)的存储和检索(找书)的方法也有所不同,大致会经历三个阶段:

 

一、顺序法


我们有10本以内的书时,不需要考虑存储和检索的方法,我们只需要把书放在一起就行。


比如想找《中式的优雅》这本书,只需要一本本按顺序找就行了(Word当中的替换功能就是计算机逐行扫描你的文档并替换你想要替换的内容)。

 

二、分类法


当我们有300本书的时候,按照顺序逐个找就很麻烦了。此时我们会将书按照不同的学科类别放在书架上(按类别存储),当需要找一本《一课经济学》的时候,首先定位到类别(即位置,属于经济学),再在这个类别当中按顺序查找。

 

三、索引法


如果我们有超过10万本书,书的数量(数据量)已经达到另一个量级,采用之前的方法进行存储和检索都是一件十分费力的事情。


此时,就像许多图书馆一样,采用索引法是最有效的方式,将每一本书进行编码,将不同类别也进行编码,使用图书索引系统的方法来查找。


比如要找一本《诉讼可视化》,输入书名(同时还可以输入作者、出版社、出版时间等,是不是和案号、当事人、法官很像?),系统反馈给我一串编码,比如D915.04/20183,按照这个编码就可以很快找到这本书。


编码(或者叫编址)的好处就是数据量可以非常非常大(亿级别),而且不需要对数据进行排序(就像第一种方法那样需要排一个顺序),但我们可以通过关键词的方式找到对应的编码,从而让计算机给出我们想要的结果。

 

Alpha大数据系统当中有超过5000多万份案例和200多万部法规,计算机是采用第三种方法进行数据存储的。


明白了计算机是采用编码法进行存储的,就知道我们需要采用索引法来进行数据的检索,也就知道如何使用该系统了。


数据库的检索逻辑

首先,计算机对每一个数据进行编码,确定一个位置,英文叫:Addressing;其次,采用计算机语言进行存储;最后,计算机通过使用者给定的关键词,找到相应的内容提供给使用者。

 

为了让计算机听懂我们的话,我们就需要按照计算机的思维跟“它”对话,告诉计算机我们要找的数据有什么特点,在哪个位置,它们之间是什么关系,对应到检索语言当中就是:检索词、检索词所在位置以及检索词之间的关系。

 

举例说明:张三住在幸福小区幸福一栋一楼,幸福一栋其他楼层的业主要加装电梯,已经获得规划部门的审批,但电梯施工过程中需要拆掉张三家阳台上的防盗网,张三可以怎么办?

 

Alpha高级检索

 

检索位置:全文、案由、当事人、法官、法院、法院观点、裁判结果、代理律师、律师事务所、标的额等


检索词:住宅、电梯、既有住宅、加装、小区、相邻关系纠纷、广州


检索词关系:同段、间隔10个字、同句、满足以下任一条件(且和或)

 

上面这个案例,我们最容易想到的就是检索词,但为了让计算机明白我们要什么,我们就需要将不同特点的检索词放在不同位置。


比如“相邻关系纠纷”就放在“案由”这个位置,“广州”就放在“法院”这个位置,其他词不知道怎么放,就放在“全文”这个位置。


然后,为了让计算机明白这些词之间是什么关系,我们需要进一步确定检索词之间的关系。


比如“住宅”和“电梯”这两个词必须挨得很近,不得超过10词。又比如“小区”和“装电梯”这两个词必须在同一句话当中。

 

案由、全文和法院的关系示意


从这个图就可以知道,在相应位置上输入符合该位置的检索词,然后限定他们之间的关系,输入的越多,几个位置之间的检索词的“交集”就越多,最后获得的结果就越精准。

 

Alpha系统的可视化功能,还能帮助我们判断潜在的检索词分别是什么,它把不同的检索词放在不同位置上,我们只需要点击相应检索词就可以添加到检索条件当中,非常实用。

 

例如下图中,在“一审裁判结果”这个位置,有两个潜在关键词 “全部/部分支持”和“全部驳回”,点击其中任何一个,就可以将该关键词添加进检索条件。


Alpha可视化-裁判结果


检索词提取方法

明白了数据是编码存储,通过索引来检索,也知道检索词、检索词所在位置以及检索词之间的关系,接下来就说说如何从案件事实当中抽取出检索词的方法,法秀平台有很多优秀的文章谈到了如何抽取关键词,我说说自己日常使用的方法。

 

一、生活化词语转化为法律术语


不管是案例、法规还是司法观点,我们找出来的东西都是“法律文件”,都是使用法律术语写就的,所以在选择检索词的时候,就需要将生活化语言转为法律术语。


生活化词语:给钱、卖房、小黄车、官司、被抓了等等


法律术语:付款、商品房销售、共享经济、诉讼、拘留等等

 

二、借助实务文章、新闻报道等提炼关键词


如果有些生活化词语一时难以找到确定的法律术语,就可以通过新闻报道和微信中的实务文章来提炼检索词了。


比如“裸贷”这个词并非法律术语,通过新闻报道和实务文章,就可以提炼出“贷款利息”、“无抵押担保”、“诈骗”、“敲诈勒索”等法律术语。然后将这些检索词输入Alpha案例库当中。

 

三、以大框小


如果实在不知道某一种案例到底属于何种案由,不如把范围放大一些。


比如“房屋买卖合同纠纷”的上位概念是“买卖合同纠纷”,再上位概念是“合同纠纷”,当你可以确定某种案例可能属于“合同纠纷”但是不确定属于哪一种“合同纠纷”,不如直接输入合同纠纷,然后通过Alpha可视化功能,查看案由位置,分别存在哪些潜在案由,再去确定你想要的。


Alpha可视化-案由分析


如果你确定属于“买卖合同纠纷类”,再点击进去,进一步限定案由,直到范围符合你的要求。

 

四、兄弟互助


在Alpha当中,“案例库”和“法规库”是互相帮助的好兄弟,如果你提取不出检索词,不如找找法条的规定吧,通过法条链接到案例。


反之,如果你找案例想找法条,也可以通过案例链接到法条,而且同一个案例当中,还可以链接到其他法条。


通过法条链接到案例


通过案例链接到法条


通过裁判文书链接到法条


掌握小技巧,事半功倍

最后,说两个大家普遍容易忽略的小技巧


一、普通检索和高级检索的区别

 

Alpha高级检索


假设你要找的案例是宝藏,藏在一栋房子,房子有很多门。


普通检索:输入一个关键词,打开一扇门,再输入一个关键词,再打开一扇门……多次输入,多次打开,最后找到宝藏。


高级检索:一次性输入多个关键词,同时打开多扇门,直达宝藏,高级!

 

二、在结果中搜索


Alpha-在结果中搜索


假设你去案例库找案例是开着一条小船去大海中捕鱼。


第一次检索:一网子下去,捕到各种鱼


在结果中搜索:在这一网子鱼当中,去找你爱吃的金枪鱼(范围缩小)


不勾选“在结果中搜索”:把刚刚网到的鱼都放回海中,重新捕,心累。

 

法律检索是不断实践和总结经验的过程,明白了数据如何存储,计算机如何处理数据,数据库的检索逻辑之后,我们就为提升检索能力打下牢固的基石了。

 

专栏编辑:则纬  |  排版编辑:Chloe

申请体验 Alpha

扫描二维码

联系诺诺多

法秀为法律人带来有价值有温度的阅读

投稿或与主编君交流请添加微信号:law-yunchu

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存